部署AI驱动的系统需要支持有效人类互动的值得信赖的模型,超出了原始预测准确性。概念瓶颈模型通过在类似人类的概念的中间级别调节分类任务来促进可信度。这使得人类干预措施可以纠正错误预测的概念以改善模型的性能。但是,现有的概念瓶颈模型无法在高任务准确性,基于概念的强大解释和对概念的有效干预措施之间找到最佳的妥协,尤其是在稀缺完整和准确的概念主管的现实情况下。为了解决这个问题,我们提出了概念嵌入模型,这是一种新型的概念瓶颈模型,它通过学习可解释的高维概念表示形式而超出了当前的准确性-VS解关性权衡。我们的实验表明,嵌入模型(1)达到更好或竞争性的任务准确性W.R.T. W.R.T.没有概念的标准神经模型,(2)提供概念表示,以捕获有意义的语义,包括其地面真相标签,(3)支持测试时间概念干预措施,其在测试准确性中的影响超过了标准概念瓶颈模型,以及(4)规模对于稀缺的完整概念监督的现实条件。
translated by 谷歌翻译
近年来,通过提取基于规则的模型,提高了深度神经网络(DNN)的可解释性和调试性,这一直有很大的努力,该模型近似于其决策边界。然而,当前DNN规则提取方法在提取DNN的潜在空间时,当提取称为分解算法时,要么限制为单层DNN或难以称为DNN或数据的大小。在本文中,我们通过介绍EclaIRE来解决这些限制,这是一种能够缩放到大型DNN架构和大型训练数据集的新型多项式规则提取算法。我们在各种任务中评估乳房,从乳腺癌预后到粒子检测,并表明它一直提取比当前最先进的方法提取更准确和可理解的规则集,同时使用数量级的计算资源。我们通过开源混音库(https://github.com/mateoespinosa/remix),使我们的所有方法包括规则集可视化接口,包括规则集可视化接口。
translated by 谷歌翻译
A self-supervised adaptive low-light video enhancement (SALVE) method is proposed in this work. SALVE first conducts an effective Retinex-based low-light image enhancement on a few key frames of an input low-light video. Next, it learns mappings from the low- to enhanced-light frames via Ridge regression. Finally, it uses these mappings to enhance the remaining frames in the input video. SALVE is a hybrid method that combines components from a traditional Retinex-based image enhancement method and a learning-based method. The former component leads to a robust solution which is easily adaptive to new real-world environments. The latter component offers a fast, computationally inexpensive and temporally consistent solution. We conduct extensive experiments to show the superior performance of SALVE. Our user study shows that 87% of participants prefer SALVE over prior work.
translated by 谷歌翻译
Climate change is expected to intensify and increase extreme events in the weather cycle. Since this has a significant impact on various sectors of our life, recent works are concerned with identifying and predicting such extreme events from Earth observations. This paper proposes a 2D/3D two-branch convolutional neural network (CNN) for wildfire danger forecasting. To use a unified framework, previous approaches duplicate static variables along the time dimension and neglect the intrinsic differences between static and dynamic variables. Furthermore, most existing multi-branch architectures lose the interconnections between the branches during the feature learning stage. To address these issues, we propose a two-branch architecture with a Location-aware Adaptive Denormalization layer (LOADE). Using LOADE as a building block, we can modulate the dynamic features conditional on their geographical location. Thus, our approach considers feature properties as a unified yet compound 2D/3D model. Besides, we propose using an absolute temporal encoding for time-related forecasting problems. Our experimental results show a better performance of our approach than other baselines on the challenging FireCube dataset.
translated by 谷歌翻译
为了为视频产生适当的标题,推理需要确定相关的概念并注意它们之间的空间关系以及剪辑中的时间发展。我们的端到端编码器视频字幕框架结合了两个基于变压器的体系结构,这是一种用于单个关节时空视频分析的改编变压器,以及用于高级文本生成的基于自我注意力的解码器。此外,我们引入了一种自适应框架选择方案,以减少所需的传入帧数,同时在训练两个变压器时保持相关内容。此外,我们通过汇总每个样本的所有基础真理标题来估计与视频字幕相关的语义概念。我们的方法在MSVD以及大规模的MSR-VTT和VATEX基准数据集上实现了最新的结果,并考虑了多个自然语言产生(NLG)指标。对多样性得分的其他评估突出了我们生成的标题结构的表现力和多样性。
translated by 谷歌翻译
由于其在非洲以外的40多个国家 /地区的迅速传播,最近的蒙基托克斯爆发已成为公共卫生问题。由于与水痘和麻疹的相似之处,蒙基托斯在早期的临床诊断是具有挑战性的。如果不容易获得验证性聚合酶链反应(PCR)测试,那么计算机辅助检测蒙基氧基病变可能对可疑病例的监视和快速鉴定有益。只要有足够的训练示例,深度学习方法在自动检测皮肤病变中有效。但是,截至目前,此类数据集尚未用于猴蛋白酶疾病。在当前的研究中,我们首先开发``Monkeypox皮肤病变数据集(MSLD)。用于增加样本量,并建立了3倍的交叉验证实验。在下一步中,采用了几种预训练的深度学习模型,即VGG-16,Resnet50和InceptionV3用于对Monkeypox和Monkeypox和Monkeypox和其他疾病。还开发了三种型号的合奏。RESNET50达到了82.96美元(\ pm4.57 \%)$的最佳总体准确性,而VGG16和整体系统的准确性达到了81.48美元(\ pm6.87 \%)$和$ 79.26(\ pm1.05 \%)$。还开发了一个原型网络应用程序作为在线蒙基蛋白筛选工具。虽然该有限数据集的初始结果是有希望的,但需要更大的人口统计学多样化的数据集来进一步增强性增强性。这些的普遍性 楷模。
translated by 谷歌翻译
在过去的几年中,不同类型的数据驱动的人工智能(AI)技术已在科学的各个领域广泛采用,用于生成预测的黑盒模型。但是,由于其黑框的性质,在接受这些模型之前对这些模型建立信任至关重要。实现这一目标的一种方法是实施事后解释方案,该方案可以提出黑框模型预测背后的原因。在这项工作中,我们为此目的提出了一种经典的热力学启发方法:AI和其他黑盒范式(TERP)的热力学解释表示。 TERP通过构建线性的局部替代模型来起作用,该模型在所解释的实例周围的小社区中近似黑框模型的行为。通过采用简单的前向特征选择蒙特卡洛算法,TERP为所有可能的替代模型分配了解释性自由能评分,以选择最佳解释。此外,我们通过成功解释来自来自相关领域的数据集的四种不同类别的黑盒模型,将TERP验证为一种通常适用的方法,包括对图像进行分类,预测心脏病和分类生物分子构象。
translated by 谷歌翻译
这项工作提出了一种基于连续的子空间学习(SSL)的生成建模方法。与文献中的大多数生成模型不同,我们的方法不利用神经网络来分析基本源分布和合成图像。所得的方法称为渐进属性引导可扩展的鲁棒图像生成(PAGER)模型,在数学透明度,渐进式内容生成,较低的训练时间,较少的训练样本以及对条件图像生成的扩展性方面具有优势。 Pager由三个模块组成:核心生成器,分辨率增强器和质量助推器。核心发电机了解低分辨率图像的分布并执行无条件的图像生成。分辨率增强子通过条件产生增加图像分辨率。最后,质量助推器为生成的图像增加了更细节。进行了有关MNIST,时尚摄影和Celeba数据集的广泛实验,以证明Pager的生成性能。
translated by 谷歌翻译
5G无线技术和社会经济转型的最新进展带来了传感器应用的范式转移。 Wi-Fi信号表明其时间变化与身体运动之间存在很强的相关性,可以利用这些变化来识别人类活动。在本文中,我们证明了基于时间尺度Wi-Fi通道状态信息的自由互助人与人类相互作用识别方法的认知能力。所检查的共同活动是稳定的,接近,离职的,握手的,高五,拥抱,踢(左腿),踢(右腿),指向(左手),指向(右手),拳打(左手),打孔(右手)和推动。我们探索并提出了一个自我发项的双向封盖复发性神经网络模型,以从时间序列数据中对13种人类到人类的相互作用类型进行分类。我们提出的模型可以识别两个主题对相互作用,最大基准精度为94%。这已经扩展了十对对象,该对象对围绕交互 - 转变区域的分类得到了改善,从而确保了88%的基准精度。同样,使用PYQT5 Python模块开发了可执行的图形用户界面(GUI),以实时显示总体相互交流识别过程。最后,我们简要地讨论了有关残障的可能解决方案,这些解决方案导致了研究期间观察到的缩减。这种Wi-Fi渠道扰动模式分析被认为是一种有效,经济和隐私友好的方法,可在相互的人际关系识别中用于室内活动监测,监视系统,智能健康监测系统和独立的辅助生活。
translated by 谷歌翻译
强大的机器学习是一个越来越重要的主题,专注于开发模型适应各种形式的不完美数据。由于在线技术中推荐制度的普遍性,研究人员进行了几项专注于数据稀疏性和轮廓注射攻击的鲁棒性研究。相反,我们为推荐系统提出了更全面的稳健性观点,包括多维尺寸 - 相对于子群体,转换,分布视差,攻击和数据稀疏性的鲁棒性。虽然有几个库允许用户比较不同的推荐系统模型,但没有软件库,可以在不同场景下对推荐系统模型进行全面的鲁棒性评估。作为我们的主要贡献,我们展示了一个强大的评估工具包,Recsys的强大健身房(Rgrecsys - https://www.github.com/salesforce/rgrecsys),它允许我们快速且统一地评估推荐系统模型的鲁棒性。
translated by 谷歌翻译